Application du coclustering à lanalyse exploratoire dune table de données
نویسندگان
چکیده
Résumé. La classification croisée est une technique d’analyse non supervisée qui permet d’extraire la structure sous-jacente existante entre les individus et les variables d’une table de données sous forme de blocs homogènes. Cette technique se limitant aux variables de même nature, soit numériques soit catégorielles, nous proposons de l’étendre en proposant une méthodologie en deux étapes. Lors de la première étape, toutes les variables sont binarisées selon un nombre de parties choisi par l’analyste, par discrétisation en fréquences égales dans le cas numérique ou en gardant les valeurs les plus fréquentes dans le cas catégoriel. La deuxième étape consiste à utiliser une méthode de coclustering entre individus et variables binaires, conduisant à des regroupements d’individus d’une part, et de parties de variables d’autre part. Nous appliquons cette méthodologie sur plusieurs jeux de donnée en la comparant aux résultats d’une analyse par correspondances multiples ACM, appliquée aux même données binarisées.
منابع مشابه
Usage non classificatoire d'arbres de classification : enseignements d'une analyse de la participation féminine à l'emploi en Suisse
Résumé. Cet article présente une application en grandeur réelle des arbres de classification dans un contexte non classificatoire. Les arbres générés visent à mettre en lumière les différences régionales dans la façon dont les femmes décident de leur participation au marché du travail. L’accent est donc mis sur la capacité descriptive plutôt que prédictive des arbres. L’application porte sur de...
متن کاملInvestigation visuelle d'événements dans un grand flot de liens
Résumé. Nous présentons une nouvelle méthode d’analyse exploratoire de grands flots de liens que nous appliquons à la détection d’événements significatifs dans plus de 2 millions d’interactions (pendant 4 mois) entre utilisateurs du réseau social en ligne Github. Nous combinons une méthode statistique de détection automatique d’événements dans une série temporelle, Outskewer, avec un système de...
متن کاملConstruction de descripteurs à partir du coclustering pour la classification supervisée de séries temporelles
Résumé. Nous présentons un processus de construction de descripteurs pour la classification supervisée de séries temporelles. Ce processus est libre de tout paramétrage utilisateur et se décompose en trois étapes : (i) à partir des données originales, nous générons de multiples nouvelles représentations simples ; (ii) sur chacune de ces représentations, nous appliquons un algorithme de cocluste...
متن کاملL'influence du mysticisme islamique sur l'éducation iranienne
Il faut savoir que le mysticisme a eu toujours de grandes influences sur tout ce qui concerne la vie et la culture iraniennes, surtout sur l’éducation qui est une étape très importante dans la formation de l’avenir de la jeunesse. C’est vrai, le mysticisme est une approche individualiste alors que l’éducation reste une affaire collective et sociale. Comment arrive-t-il, étant une pratique perso...
متن کاملConstruction et analyse de résumés de données évolutives : application aux données d'usage du Web
Résumé. La manière dont une visite est réalisée sur un site Web peut changer en raison de modifications liées à la structure et au contenu du site lui-même, ou bien en raison du changement de comportement de certains groupes d’utilisateurs ou de l’émergence de nouveaux comportements. Ainsi, les modèles associés à ces comportements dans la fouille d’usage du Web doivent être mis à jour continuel...
متن کامل